(19) 



J 



Europaisches Patentamt 
European Patent Office 
Office europeen des brevets 



I 



(11) 



BP 1 241 600 A1 



(12) 



EUROPAISCHE PATENTANMELDUNG 



(43) 


Veroffentlichungstag: 


(51) Intci7: G06F 17/60, H04M 3/493 




18.09.2002 Patentblatt 2002/38 


(21) 


Anmeldenummer: 01106128.0 




(22) 


Anmeldetag: 13.03.2001 




(84) 


Benannte Vertragsstaaten: 


(72) Erfinder: Jugovec, Wolfgang 




AT BE CH CY DE DK ES Fl FR GB GR IE IT LI LU 


5212 Hausen bei Brugg (CH) 




MC NL PT SE TR 






Benannte Erstreckungsstaaten: 


(74) Vertreter: Berg, Peter et al 




AL LT LV MK RO SI 


European Patent Attorney, 






Siemens AG, 


(71) 


Anmelder: Siemens Schweiz AG 


Postfach 22 16 34 




8047 Zurich (CH) 


80506 Miinchen (DE) 
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(57) Zur Generierung von Antwortmeldung auf ein- 
gehende Meldungen wird ein Verfahren und ein Kom- 
munikationssystem vorgeschlagen. Es entlialteine Dia- 
logmaschine (5), eine Vermittlungseinlneit (4), ein 
Spraclieingabemodul (53) und ein Sprachausgabemo- 
dul (52). Die eingelnenden IVIeldungen sind ausgebildet 
als Anrufe in Eclitzeit, als gespeiclierte Anrufe oder als 
Textmeldungen. Von diesen IVIeldungen wird eine typi- 
sierte Adresse angelegt und einem Spracheingabemo- 
dul (53) zugefuhrt. Uber Verfahrensschritte in einer aku- 
stischen vorverarbeitungseinheit (6), einer Spracher- 



kennungseinheit (3) und einem Textausgabe-Dispat- 
clier (7) wird eine Anfrage zu einer Datenbank (9) er- 
zeugt. Antwortmeldungen von dieser Datenbank (9) 
werden entwederdirektan den Ursprung oder uber eine 
Text-Vorverarbeitungseinheit (1), eine Sprachsynthe- 
seeinheit (2) und einen Sprachausgabe-Dispatcher (8) 
an den Ursprung der eingegangenen Meldung ubermit- 
telt. Nicht bearbeitbare Anrufe werden zu Agenten 
durchgeschaltet. Der modulare Aufbau des Kommuni- 
kationssystem eriaubt, verschiedene Produkte zur 
Sprachsynthese oder Spracherkennung ohne eine 
Neuintegration einzusetzen. 
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Beschreibung 

[0001] Die vorliegende Erfindung betrifft ein Verfahren zur Generierung von Antwortmeldungen auf eingehende Mel- 
dungen mit einem Kommunikationssystem und ein Kommunikationssystem zur Generierung von Antwortmeldung auf 

5 eingehende Meldungen gemass dam Oberbegriff des Patentanspruclis 1 bzw. 10. 

[0002] Unter den Begriff Spracliverarbeitung fallt einerseits eine Umsetzung von Spraclie in Text - meist Spraclier- 
kennung genannt - und andererseits eine Umwandlung von Text in Sprache - meist Sprachsynthese genannt - . 
[0003] Fur die Umwandlung von Text in Spracine und umgekehrt gibt es sogenannte "Software Development Kits", 
mit denen Produkte fallweise und individuell in entsprechende Kundenlosungen integriert werden. Nachteilig ist, das 

10 der Wechsel zu einem anderen Produkt eine vollstandig neue Integration erfordert. 

[0004] Anfragen von Kunden sollten moglichst unabliangig davon sein, von welclier Art das Anfrage-IVIedium ist. 
Folgende Arten des Anfrage-ZAntwort-IVIediums treten haufig auf: 

Direktes Telefongespracli mit einem Agenten; 
15 - ein Spracliaufzeiclinungsgerat - aucli Telefonbeantworter genannt - das direkt angewalilt oder bei Nichtverfug- 
barkeit eines Agenten zugesclialtet wird; 
E-IVIail mit einer Anfrage in Textform; 

E-IVIail, das eine Audio-Datei mit einer gesproclienen Nachricht enthalt. 

20 Welter soli es unerhebllch sein, ob eine E-IVIall In Textform ursprungllch als solche vorlianden war oder belspielswelse 
aus dem GSM-Dlenst Short Message Service erzeugt wurde. 

[0005] In WO 99/07118 ist ein Kommunikationssystem angegeben, das eriaubt, ein Zeitverwaltungssystem mit in 
E-IVIail enthaltenen gesprochenen Nachrichten bezuglich Verabredungsdaten wie Datum/Uhrzeit, Ort und ailenfalls 
Betreff abzugleichen oder abzufragen und automatisch ein E-IVIail zu generieren, das die ursprunglich vereinbarten 

25 Oder die neuen Verabredungsdaten enthalt. 

[0006] Bei Kommunikationssystemen der vorgenannten Art wie auch z.B. bei der Sprachsynthese fur Auskunftssy- 
steme, besteht das Problem, bei einem Wechsel zu einem anderen Produkt der Sprachsynthese (TTS Text to Speech) 
und/oder der Spracherkennung (ASR Automated Speech Recognition) eine vollstandig neue Integration in das betref- 
fende Kommunikations- und Datenbanksystem vornehmen zu miissen. 

30 [0007] Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren und ein Kommunikationssystem 
der eingangs genannten Art anzugeben, das eine automatisierte Generierung von Antwortmeldungen ermoglicht und 
mit geringem Integrationsaufwand an verschiedene Produkte zur Sprachsynthese und/oder zur Spracherkennung an- 
passbar ist. 

[0008] Diese Aufgabe wird durch die im Patentanspruch 1 bzw. 10 angegebenen Massnahmen gelost. Vorteilhafte 

35 Ausgestaltungen der Erfindung sind in weiteren Anspruchen angegeben. 

[0009] Durch die im Patentanspruch 1 angegebenen Verfahrensschritte werden eingehende Anrufe unabhangig von 
der Art automatisch analysiert und in Anfragen zu einer Datenbank konvertierbare Anrufe fuhren zu von einer Daten- 
bank erzeugten Antwortmeldung, die direkt als Text-Antwortmeldung oder durch eine Konversion in einem Sprachaus- 
gabemodul als gesprochene Antwortmeldung an den Ursprung geleitet werden, wobei die nichtkonvertierbaren Anrufe 

40 zur personlichen Weiterbehandlung einem Agenten zugewiesen werden. 

[0010] Das im Patentanspruch 1 0 angegebene Kommunikationssystem weist eine Gliederung in Funktionseinheiten 
auf, so dass fur die verschiedenen Einheiten Produkte einsetzbar sind, die leicht ausgetauscht werden konnen und 
eine Aufteilung auf verschiedene Server eines Rechnersystems ermoglichen. 
[0011] So konnen sich die folgenden Vorteile zusatzlich ergeben: 

45 

\) Dadurch dass 

die im Verfahrensschritt D1 vom Sprachausgabemodul konvertlerten Antwortmeldungen mit festen Sprachtexten 
erganzt werden; 

ergibt sich fur die Anfrage einer Person den Eindruck einer personlichen Antwort und hilft, Vorurteile und Aversio- 
50 nen gegenuber automatisierten Auskunftssystem abzubauen (Patentanspruch 2). 

ii) Dadurch dass 

die zusammen mit der typisierten Adresse gespeicherte Textmeldung vor Ausfuhrung des Verfahrensschrittes D1 
mit einem Hinweistext erganzt wird, der vom Ergebnis der im Verfahrensschritt B11 vorgenommenen Konversion 
55 abhangig ist; 

werden alle eingehenden Textmeldungen in einer auch fur den unbeholfenen Anwender akzeptablen Form beant- 
wortet (Patentanspruch 6). 
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iii) Dadurch dass 

im Verfahrensschritt D1 vorgangig der Konversion im Sprachausgabemodul die Antwortmeldung in einer im 
Sprachausgabemodul enthaltenen Text-Vorverarbeitungseinheitbezuglich der in der Antwortmeldung enthaltenen 
Ziffern gruppiert wird oder bezuglich in der Antwortmeldung enthaltenen fremdsprachlgen Wortern phonetisch 

erganzt wird; 

ist die generierte Antwortmeldung an die verschiedenen Gewohnheiten in den Sprachregionen oder Landern leicht 
anpassbar und erhoht die Akzeptanz in der Nutzung solcher Kommunikationssysteme (Patentanspruch 7). 

iv) Dadurch dass 

die Vermittlungseinheit (4) und/oder das Spracheingabemodul (53, 3) und/oder das Sprachausgabemodul (52, 2) 
auf mehrere uber ein Netzwerk verbundene Server (10, 20, ..) verteilt implementiert ist; 

kann das erfindungsgemasse Kommunikationssystem auf die jeweilige Anwendung angepasst auf die jeweilige 
Serverumgebung skalierbar implementiert werden. 
(Patentanspruch 14). 

v) Dadurch dass 

Schnittstellen (62, 63; 61 , 66) zur Sprachsyntheseeinheit (2) oder zur Spracherkennungseinheit (3) so ausgebildet 
sind, dass auf den verschiedenen Servern (10, 20, ..) verschiedene Sprachsyntheseeinheiten (2) oder verschie- 
dene Spracherkennungseinheiten (3) auf den Servern (10, 20, ..) gegenseitig austauschbar sind; 
konnen verschiedene Produkte parallel eingesetzt werden, ohne dass eine Neuintegration erforderlich ist und 
durch den parallelen Einsatz verschiedener Produkte konnen spezifische Produkteigenschaften besonders ge- 
nutzt Oder vermieden werden (Patentanspruch 15). 

[0012] Die Erfindung wird nachfolgend anhand der Zeichnung beispielsweise naher eriautert. Dabei zeigen: 

Figur 1 in Funktionseinheiten angegebene Struktur eines erfindungsgemassen Kommunikationssystems; 
Figur 2 Implementierung des erfindungsgemassen Verfahrens auf ein Rechnersystem. 

[0013] Figur 1 zeigt eine in Funktionseinheiten angegebene Struktur eines Ausfiihrungsbeispiels eines erfindungs- 
gemassen Kommunikationssystems. Die angegebenen Pfade sind nicht notwendigerweise als physische Anschlusse 
Oder Verbindungen anzusehen, sondern bevorzugt als logische oder funktionale Pfade. Das in Fig. 1 dargestellte 
Kommunikationssystem enthalt erstens die Funktionseinheiten Dialogmaschine 5 und Vermittlungseinheit 4, die uber 
externe Schnittstellen 60 an ein offentliches oder privates Netzwerk angeschlossen ist. Diese Schnittstelle 60 kann 
verbindungslos mit einem Packetnetz, z.B. auf dem Protokoll TCP/IP basierend und/oder verbindungsorientiert mit 
einem TDM-Netz (Time Division Multiplex), z.B. uber wenigstens einen ISDN-Primaranschluss S2 ausgelegtsein. Zwei- 
tens enthalt das Kommunikationssystem ein Spracheingabemodul 53 und ein Sprachausgabemodul 52. Dem Kom- 
munikationssystem ist uber eine weitere Schnittstelle 69 eine Datenbank 9 zugeordnet, in der eine Wissens- oder 
Informationsbasis enthalten ist, wie beispielsweise: 

Verzeichnis uber Personen, 

Losungsvorschlage zu uber ein Produkt gestellten Fragen, 

Information uber den Zustand der Elemente eines Energieverteilungsnetzes. 

[0014] Die Dialogmaschine 5 ist uber Schnittstellen 68 mit Terminals verbunden. Als Terminals sind vorzugsweise 
als Personalcomputer ausgebildete Arbeitsplatzsysteme vorgesehen, die neben Tastatur und Bildschirm auch Sprach- 
eingabe-ZSprachausgabemittel aufweisen wie z.B. eine Kopfsprechgarnitur. Physisch ist die Schnittstelle 68 bevorzugt 
als lokales Netzwerk LAN (LAN Local Area Network) ausgefuhrt. Der Vermittlungseinheit 4 kann ein Web-Server zu- 
geordnet sein, der jene Inhalte und Steuerungsinformation enthalt, die von der Dialogmaschine 5 in der Interaktion mit 
den Agenten oder mit uber die Schnittstelle 60 kommunizierenden Anwender benotigt werden. Es ist auch moglich, 
dass die Anwenderterminals selbst an das LAN 68 angeschlossen sind. Ebenso ist es auch moglich, den Web-Server 
als Teil der Vermittlungseinheit 4 zu implementieren. 

[0015] Das erfindungsgemasse Verfahren wird anhand von zwei Formaten von eingehenden Meldungen eriautert: 
Format I: 

Eine als Anruf ausgebildete eingehende Meldung fuhrt selbstandig zu einer Generierung einer Antwortmeldung. 

Format II: 

Eine als Text ausgebildete eingehende Meldung fuhrt selbstandig zu einer Generierung einer Antwortmeldung. 
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Format I: 

[0016] Voraussetzung: Alle Agenten sind beschaftigt oder eingehende Anrufe werden stets zur Dialogmaschine 5 
geleitet. 

I. Verfahrensschritt A1 : 

[0017] Uber die Schnittstelle 60 bei der Vermittlungseinheit 4 eingehende Anrufe werden von der Dialogmaschine 
5 mit einem entsprechenden gesprochenen Hinweis entgegengenommen. Diese Hinweistexte sind dabei als direkt 

adressierbare Audio-Dateien vorzugsweise im Sprachausgabemodul 52 gespeichert. In einem von der Dialogmaschine 
5 und/odervonder anrufenden Person gesteuerten oderzu steuernden Dialog wird der Anrufhinsichtlich Art, Ursprung 
und Ursprungsadresse analysiert und zusammen mit dem gesprochenen Anruftext in einem ersten Speicherbereich 
als typisierte Adresse TYPE_ADDR abgelegt. Somit wird fur jeden Anruf eine solche Adresse TYPE_ADDR angelegt. 
Ein Beispiel einer Struktur einer typisierten Adresse TYPE_ADDR ist in der nachfolgenden Tabelle 1 angegeben: 



Tabelle 1 



Struktur einer typisierten Adresse TYPE_ADDR 


Feld 


Bedeutung 


DATE_TIME_MSG 


Datum/Uhrzeit des Eingangs 


ADDR_SRC_TYPE 


Typ der eingegangenen Meldung 


ADDR_SRC 


Ursprungsadresse 


ADDR_SRC_CODING 


Cod ie rung 


ADDR_SRC_PATH 


Pfad der Herkunft 


DATE_TIME_ANSWER 


Gewunschtes Datum/Uhrzeit der Antwortmeldung 


INPUT_ADDRESS 


Empfangeradresse 






ADDR_SRC_MSG_TYPE 


Dateiformat der eingegangenen Meldung 


PTR_ADDR_SRC_MSG_BODY 


Zeiger auf die gespeicherte eingegangene Meldung 


ANSWER_TYPE 


Typ der generierten Antwortmeldung 






PTR_ANSWER_FILE 


Zeiger auf die Antwortdatei 


STATUS 


Status der eingegangenen Meldung 







[0018] Bezuglich Ursprungsadresse ADDR_SRC wird entweder die als Absender vermerkte E-Mail-Adresse, bei- 
spielsweise bei einer reinen IP-Sprachubertragung oder die Rufnummer gemass dem ISDN-Leistungsmerkmal CLIP 
(Calling Line Identification Presentation) in der typisierten Adresse TYPE_ADDR gespeichert. Fur den Ursprung 
ADDR_SRC_PATH wird der eingehende Pfad eingetragen, dies ist relevant fur eine nachfolgende Signalverarbeitung 
in der akustischen Vorverarbeitungseinheit 6. Der eingegangene gesprochene Meldungstext, d.h. ein Anruf ist als 
Audiodatei vorzugsweise auf einem Massenspeicher abgespeichert, der im folgenden zweiter Speicherbereich ge- 
nannt wird (nicht dargestellt in Fig. 1 ). Falls der Anruf mit der mundlichen Mitteilung einer Person als Datei eingegangen 
ist, kann die Datei im eingegangenen Format, z.B. .wav oder .mp3 direkt abgespeichert werden. Fur die Verknupfung 
typisierte Adresse TYPE_ADDR mit der Meldung ist vorzugsweise ein Zeiger vorgesehen. Die Verknupfung kann zwei- 
seitig vorgesehen sein, d.h. zusatzlich zur abgespeicherten Datei ist auch ein Zeiger zur typisierten Adresse 
TYPE_ADDR abgelegt. 

I. Verfahrensschritt 81 : 

[0019] Die weitere Verarbeitung des eingegangenen Anrufes erfolgt in einem Spracheingabemodul 53, das die be- 
reits erwahnte akustische Vorverarbeitungseinheit 6, eine SpracherkennungseinheitS und einen Textausgabe-Dispat- 
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Cher 7 enthalt. Der Informations- bzw. Datenfluss ist im Spracheingabemodul 53 generell mit dem Bezugszeichen 63 
bezeichnet, in der naclifolgenden Eriauterungen wird jeweils konkret auf die jeweilige Sclinittstelle oder das jeweilige 
Format zwischen den einzelnen Einheiten hingewiesen. Zunachst wird der gespeicherte Anruf der akustischen Vor- 
verarbeitungseinheit 6 zugefuhrt. Aufgrund der Angaben in den Feldern ADDR_SRC_CODING, ADDR_SRC_PATH 
und ADDR_SRC_I\/1SG_TYPE kann in der akustischen Vorverarbeitungseinheit 6 z.B. eine Korrektur einer systema- 
tischen akustischen Abweichung von einem Normpegel oder eine Rauschunterdruckung vorgenommen werden; vor- 
zugsweise wird in der akustischen Vorverarbeitungseinheit 6 auch eine Konversion in ein einheitliches Dateiformat 
vorgenommen. Der eingegangene Anruf wird nach dieser Vorverarbeitung der Spracherkennungseinheit 3 zugefuhrt 
und diese erzeugt eine Textdatei, die den Inhalt der gesprochenen Nachricht als Text enthalt. Diese Textdatei wird 
anschliessend einem Textausgabe-Dispatcher 7 zugefuhrt, in dem eine semantische Analyse erfolgt. Ergibt diese se- 
mantische Analyse einen plausiblen Kontext zur vorgesehenen Abfrage in der Datenbank 9, wird gemass einer fest- 
gelegten Syntax eine Abfragedatei QUERY_FILE erzeugt. Die Struktur einer solchen Abfragedatei QUERY_FILE ist 
beispielhaft in Tabelle 2 angegeben: 



Tabelle 2 



QUERY_FILE 


Name 


Bedeutung 


QUERY 


Kennzeichnung als Abfrage 


SUBSCRIBER_ID= 


Teilnehmernummer 


NAME= 


Name 


LOCATION^ 


Ort 


POSTAL_CODE= 


Postleitzahl 







[0020] Bel diesem Beispiel wird unterstellt, dass eine anrufende Person eine Auskunft uber eine Telefonnummer 
eines Teilnehmers wunscht, der uber seinen Namen und Wohnort identifiziert ist. Fur die Abfrage konnen weitere in 
der Abfragedatei QUERY_STRUCTURE nicht dargestellte Felder vorgesehen sein. Mit einem uber die Steuerungs- 
schnittstelle 66 an die Vermittlungseinheit 4 zugefuhrten Kommando COMMAND wird die Abfragedatei QUERY_FILE 
an eine Datenbank 9 ubermittelt. Die von der Datenbank 9 generierte Antwortmeldung, wird vorzugsweise als struk- 
turierte Datei von Vermittlungseinheit 4 in einem zweiten Speicherbereich abgelegt und die entsprechende typisierte 
Adresse wird mit dieser Antwortdatei verknupft, dazu ist ein Feld PTR_ANSWER_FILE in der typisierten Adresse 
vorgesehen. Zur vorgenannten semantischen Analyse kann ein in der typisierten Adresse enthaltenes Feld 
INPUT_ADDRESS herangezogen werden, aus diesem Feld ist der Regelfall ableitbar, welche Art von Antwortmeldun- 
gen die anrufende Person wunscht. Dies ist insbesondere dann wichtig, wenn mit dem erfindungsgemassen Kommu- 
nikationssystem vollig unterschiedliche Kategorien von eingehenden Meldungen und entsprechenden Antwortmeldun- 
gen generiert werden sollen, beispielsweise Adressauskunfte fur ein breites Publikum und Netzzustandsauskunfte fur 
einen eng begrenzten Kundenkreis eines Netzbetreibers. 

I. Verfahrensschritt C1 : 

[0021] Fur den Fall, dass die Spracherkennungseinheit 3 den eingegangenen Anruf nicht in eine Textdatei umwan- 
deln kann, wird uber die Steuerungsschnittstelle 66 ein entsprechendes Kommando COMMAND an die Vermittlungs- 
einheit 4 ubermittelt, die den eingegangenen Anruf z.B. als E-Mail einem Agenten zusendet. Dieses E-Mail enthalt 
einerseits die typisierte Adresse und andererseits den Anruf, z.B. als sogenanntes Attachment im Format .wav. Die 
Angabe der typisierten Adresse in dieser E-Mail kann gegenuber der abgespeicherten typisierten Adresse nur jene 
Felder enthalten, die fur die Bearbeitung durch einen Agenten erforderlich sind, dabei wird der Inhalt fur die Darstellung 
vorzugsweise in ein benutzerfreundliches Format konvertiert. Die Zustellung an einen Agenten braucht nicht personi- 
fiziertzu sein, sondern fur alle Agenten kann ein einziges Eingangspostfach vorgesehen sein, das von ihnen sequentiell 
abzuarbeiten ist. Kann durch den Textausgabe-Dispatcher keine solche Abfragedatei erzeugt werden, wird uber die 
Steuerungsschnittstelle 66 ein entsprechendes Kommando COMMAND an die Vermittlungseinheit 4 ubermittelt und 
der eingehende Anruf wie vorhin bereits beschrieben mittels einem E-Mail an einen Agenten weitergeleitet. Die vor- 
genannte Zustellung wie auch die Weiterleitung von Anrufen erfolgen selbstandig in der Dialog maschine 5. 
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I. Verfahrensschritt D1 

[0022] Aufgrund einer Zustandsinformation STATUS und einer Angabe im Feld ANSWER_TYPE der typisierten 
Adresse, wird die im zweiten Speiciierbereicli in Textform abgeiegte Antwortmeldung der im Sprachausgabemodui 52 

5 enthaltenen Text-Vorverarbeitungseinheit 1 zugefuhrt. Der Informations- bzw. Datenfluss ist im Spraclnausgabemodul 
52 generell mit dam Bezugszeiclnen 62 bezeicinnet, in der nachfolgenden Eriauterungen wird jeweils l^onl^ret auf die 
jeweilige Sclinittstelle oder das jeweilige Format hingewiesen. Je nach Anwendung sind in der Text-Vorverarbeitungs- 
einheit 1 mehrere, ggf. I<umulative Scliritte auf die in Textform vorhandene Antwortmeldung anzuwenden. Zunachst 
werden allfallige enthaltene Abl<urzungen wie z.B. "str." in "Albisriederstr." fur "strasse" oder NE in "Fleurier NE" fur 

10 "Neuchatel" als Text expandiert. In einem weiteren Schritt wird die Text-Vorverarbeitungseinlieit 1 mit Hilfe eines plio- 
netisclien oder eines syntai<tisclien Lexikons die Textdatei an die Gewolnnheiten der jeweiligen Diktion angepasst. 
Telefonnummern der Art "0714953286" sind nicht als Zaiil, sondern als Zahlenfolge auszusprechen, demzufolge ist 
die vorgenannte Nummer in die Zahlenfolge "0 71 495 32 86" zu gliedern. Speziell in Landern mit mehreren Amtsspra- 
chen konnen bestimmte Adressbestandteile in verschiedenen Sprachen abgelegt sein, z.B. "Dufourstrasse" oder "IVly- 

15 thenquai". Die korrekte schriftliche Angabe "Dufour" wird in eine phonetische Angabe "dufuhr" umgewandelt. Die vor- 
genannten Lexika konnen als eine weitere Datenbank dem Sprachausgabemodui 52 zugeordnet oder im Sprachaus- 
gabemodui 52 enthalten sein. Als weiterer Verfahrensschritt in der Text-Vorverarbeitungseinheit 1 ist die Konversion 
von Wortern in sogenannte "Phoneme" oder Laute vorzunehmen, je nach venwendetem Produkt kann dieser Verfah- 
rensschritt auch in der Sprachsyntheseeinheit 2 ablaufen. Die in eine phonetische Textdatei umgewandelte Antwort- 

20 datei wird der Sprachsyntheseeinheit 2 zugefuhrt, die eine die gesprochene Antwortmeldung enthaltende Sprachaus- 
gabedatei erzeugt. Diese Sprachausgabedatei ist vorzugsweise im Format .mp3 und wird dem Sprachausgabe-Dis- 
patcher 8 zugefuhrt. Der Sprachausgabe-Dispatcher 8 erganzt die vorstehend genannte Sprachausgabedatei mit so- 
genannten "Voice-Prompts", das sind gesprochene Textbausteine um gegenuber dem Anrufer die Auskunft in einer 
der guten Gepflogenheiten genugenden Form zu ubermitteln. Beispiele solcher Textbausteine: "Die gewunschte Adres- 

25 se lautet:" oder "Wir danken fur Ihren Anruf". Ueber die Steuerungsschnittstelle 61 wird ein entsprechendes Kommando 
COMMAND an die Vermittlungseinheit 4 ubermittelt, das die erfolgreiche Generierung einer Sprachausgabedatei mel- 
det. 

[0023] Diese Sprachausgabedatei wird vorzugsweise ebenfalls im zweiten Speicherbereich abgelegt. Dabei wird in 
der typisierten Adresse ein Zeiger auf die Sprachausgabedatei gesetzt und der Status nachgefuhrt, z.B. 
30 READY_FOR_DISPATCHING. Abhangig von den Angaben in der typisierten Adresse wird die Antwortdatei als E-Mail 
an die Ursprungsadresse zuruckgesandt oder nach einem erfolgten Verbindungsaufbau (CONNECT) zur Ursprungs- 
adresse abgespielt. 

[0024] Durch die Angaben in der typisierten Adresse, insbesondere durch jene im Feld Status, ist es auch moglich, 
einen eingehenden Anruf in Echtzeit mit den vorstehend eriauterten Verfahrensschritten zu beantworten. Dabei erfolgt 
35 unmittelbar vor dem Verfahrensschritt B1 gemass dem zu fuhrenden Dialog eine Iteration von Verfahrensschritten zur 
Spracherkennung und zur Sprachsynthese. Diese Iteration wird solange durchgefuhrt, bis durch die Spracherken- 
nungseinheit 3 und durch den Textausgabe-Dispatcher die eine Anfrage gebildet werden kann. 

Format II: 

40 

[0025] Voraussetzung: Eine als Text ausgebildete eingegangene Meldung. 

[0026] Eine in Textform eingegangene Meldung hat vorzugsweise ein vereinbartes Format, dass entweder von einer 
Anwendung bei der anf ragenden Person so erzeugt wird oder von der anfragenden Person direkt so erstellt wird. Dabei 
wird zweckmassigerweise ein Format vereinbart, das eine Struktur gemass der Darstellung in Tabelle 2 aufweist. Dabei 
45 konnen zusatzliche Felder vorgesehen sein, in denen beispielsweise der gewunschte Antworttyp oder der gewunschte 
Antwortzeitpunkt angegeben werden konnen. Die Angabe des Antwortzeitpunktes ist vorteilhaft fur die Generierung 
eines Zusatzdienstes, in dem z.B. ein mobiler Teilnehmer wahrend seiner Reisezeit bestimmte Informationen erhalten 
kann, die abhangig vom Anfragezeitpunkt in der Datenbank sind, z.B. Zustandsdaten eines Netzes. Nachfolgend wird 
eine unter "Format I" kumulativ vorgesehene Ausfuhrungsform der vorliegenden Erfindung beschrieben. 

50 

II. Verfahrensschritt A1 

[0027] Der Verfahrensschritt A1 unterscheidet sich nicht von jenem, bei dem ein Anruf als eingehende Meldung 
behandelt wird. Zur Erganzung zu dem unter I. eriauterten Verfahrensschritt A1 konnen in einer bevorzugten Ausfuh- 
55 rungsform die Angaben in typisierte Adresse zur Steuerung des gesamten Verfahrensablaufes benutzt werden. Mit 
den Feldern ADDR_SRC_TYPE, ADDR_SRC, DATE_TIME_ANSWER, ANSWER_TYPE und der Fortschreibung des 
Bearbeitungszustandes einer eingehenden Meldung im Feld STATUS uber die Steuerungsschnittstellen 61 und 66 
kann eine solche Meldung direkt einer Einheit in den beiden Modulen 53 und 52 bzw. der Datenbank 9 zugewiesen 
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werden. Alternativ ist es auch moglich ohne den angegebenen Informationsfluss zu tangieren, aufgrund der Angaben 
in den Feldern in der typisierten Adresse Dateien von den einzelnen Einheiten transparent, d.h. ohne Ausfuhrung eines 
Verarbeitungsschrittes welter zu leiten. 

5 II. Verfahrensschritt B11 

[0028] Wie vorstehend eriautert, wird die eingehende Meldung dem Textausgabe- Dispatcher 7 zugefuhrt, in dem 
dieunter B1 beschriebene Erzeugung einer Abfragedatei QUERY_FILE vorgenommen wird. Dabei kann die genannte 
semantische Analyse auch entfallen, da in einer eingegangenen Meldung in Textform insbesondere keine Ftillworter 

10 zu erwarten sind. Trotzdem ist der Fall einzubeziehen, wo derTextausgabe-Dispatcher 7 keine Abfrage-Datei erzeugen 
kann. Tritt dieser Fall ein, wird uber die Steuerungsschnittstelle 66 ein entsprechendes Kommando COMMAND an die 
Vermittlungseinheit 4 ubermittelt, und die betreffende Meldung entweder versehen mit einem eriauterten Text an die 
Ursprungsadresse zuruckgesandt oder in Form eines E-Mails einem Agenten zugewiesen. Fur den Regelfall, wo eine 
Abfragedatei QUERY_FILE erfolgreich erzeugt werden kann, erfolgt die weitere Verarbeitung gemassden vorstehend 

15 beschriebenen Verfahrensschritten C1 und D1. 

[0029] Die vorstehend eriauterten Verfahrensschritte im Spracheingabemodul 53 und im Sprachausgabemodul 52 
sind frei entsprechend der jeweiligen Anwendung und des jeweiligen Ursprungs der Meldungen voneinander unab- 
hangig und somit frei kombinierbar. Insbesondere ist auch die weitere Verarbeitung der von der Sprachsyntheseeinheit 
generierten Antwortmeldung unabhangig von z.B. der akustischen Vorverarbeitung. 

20 [0030] In der Fig. 2 ist eine bevorzugte Implementierung des erfindungsgemassen Verfahrens auf ein Rechnersystem 
dargestellt. Mit den Bezugszeichen 10, 20, 30 und 40 sind vier Server dargestellt, die je ein Prozessorsystem und 
einen Massenspeicher aufweisen. Diese Server sind uber ein lokales Netzwerk48 miteinander verbunden. An diesem 
Netzwerk 48 sind die fur die Agenten vorgesehenen Terminals direkt oder uber z.B. Router angeschlossen. Fur die 
Verbindung nach aussen konnen Gateways oder eine Nebenstelle vorgesehen sein, wobei die einen eingehenden 

25 Anruf aus dem offentlichen leitungsvermittelten Netz in ein packetorientiertes Format, beispielsweise auf dem Internet- 
Protokoll basierend, konvertieren. Uber weitere Router und ggf. eine Firewall kann dieses lokale Netzwerk direkt zu 
einem Internet-Service-Provider geschaltet werden. Die gemass den Verfahrensschritten B1 und D1 vorzunehmenden 
Konversionen in der Sprachsynthese-Einheit 2 und der Spracherkennungseinheit 3 erfordern eine hohe Rechenlei- 
stung. In einer Implementation gemass der Fig. 2 sind die vorgenannten Einheiten 2 und 3 auf die Server 10, 20 und 

30 30 verteilt, d.h. je einmal vollstandig implementiert, dies ist mit den Bezugszeichen 1 2, 1 3; 22, 23 und 32, 33 dargestellt. 
Dadurch ist eine parallele Arbeitsweise moglich, die die Verarbeitungskapazitat wie auch die Redundanz des erfin- 
dungsgemassen Verfahrens wesentlich erhoht. Ebenso ist die Vermittlungseinheit 4 dreifach implementiert. In dieser 
Ausfuhrungsform ist die Dialogmaschine 5 dem vierten Server 40 zugeordnet. Auf dem Server 5 wird auch auf die 
Lastverteilung fur die vorgenannten drei Server vorgenommen. In dieser Implementation ist die Datenbank 9 auf dem 

35 vierten Server 40 enthalten. Je nach Anwendung kann die Datenbank auch abgesetzt sein oder von einem externen 
Provider betrieben werden. Die in wenigstens einer weiteren Datenbank enthaltenen Sonderlexika, die vom Textaus- 
gabe-Dispatcher 7 benotigt werden, ist vorzugsweise einmal auf einem Server implementiert. Die Zuordnung zu den 
einzelnen Servern der weiteren Einheiten wie z.B. die akustische Vorverarbeitungseinheit 6 oder die Text-Vorverar- 
beitungseinheit 1 ist in Fig. 2 nicht dargestellt. Moglich ist ebenfalls eine "verteilte" Zuordnung oder eine Zuordnung 

40 an einen einzigen Server. 

[0031] Fur die Implementierung der einzelnen Einheiten wird vorzugsweise eine Architektur gemass CORBA ver- 
wendet. Das Akronym CORBA steht fur Common Object Request Broker Architecture. Die technische Implementation 
dieser Architektur basiert auf sogenannten ORB's (ORB: Object Request Broker). Ein ORB ermoglicht es einem Client 
- das ist hier z.B. eine eingegangene Meldung - ein Kommando COMMAND (vgl. z.B bei den Verfahrensschritten B1 , 

45 D1) an ein Serverobjekt zu senden, das auf demselben oder einem anderen Server ablaufen kann. Der ORB ist die 
Instanz, die das Serverobjekt findet, die Parameter ubergibt, dort die Funktion aufruft und nach erfolgter Abarbeitung 
das Resultat an den Client zuruckgibt. Die Architektur CORBA enthalt eine implementationsunabhangige Schnittstel- 
lenbeschreibungssprache IDL (Interface Description Language). Nach erfolgter Schnittstellendefinition konnen an- 
schliessend in der Codierung von Client und Serverobjekt verschiedene Sprachen venwendet werden, z.B. Java fur 

50 den Client, C++ fur das Serverobjekt sowie eine Datenbankabfragesprache fur den Zugriff auf die Datenbank 9 oder 
die die Sonderlexika enthaltende Datenbank. Durch die Verwendung der Architektur CORBA und durch die Gliederung 
in Funktionseinheiten ist es moglich, insbesondere fur die Spracherkennungseinheit 3 und die Sprachsyntheseeinheit 
2 Produkte anderer Hersteller einzusetzen, ohne das eine Neuintegration des gesamten Kommunikationssystems 
erforderlich ist. Alternativ zur Architektur CORBA kann auch die objektorientierte Programmiersprache Java zur Im- 

55 plementierung auf die verschiedenen Server verwendet werden. Die Schnittstellen 62 zur Sprachsyntheseeinheit 2 
konnen im Fall von CORBA mittels SAPI (Speech Application Programming Interface) realisiert oder bei Wahl der 
vorgenannten Programmiersprache Java mittels JSAPI (Java Speech Application Programming Interface) werden. 
Java wie auch JSAPI zeichnet sich dadurch aus, dass der nach einer Compilation in sogenannten "Bytecode" uber- 
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setzte Quellprogrammcode - einschliesslich der Interface-Definitionen - auf irgendeinem Server des Rechnersystems 
ablaufen kann; Voraussetzung ist lediglich, dass ein entsprechendes Laufzeitsystem, das ist in diesem Fall eine so- 
genannte "Java virtual machine" installiert ist, dass den "ByteCode" in auf dem betreffenden Server ablauffahige Ma- 
schineninstruktionen ubersetzt. Furdie vorstehend bei der Beschreibung fur das Format I eriauterten Verfahrensschrit- 
te D1 wird vorzugsweise zur Sprache JSAPI die Sprache JSML (Java Speech Markup Language) verwendet. Dazu 
wird ein Element "SAYAS" venwendet, mit dem eine Prosodie-Analysis und eine prosodische Markierung der in Textform 
vorliegenden Phrasen und Phrasenteile vorgenommen warden kann. Damit ist es auch moglich, in den zu syntheti- 
slerenden Phrasen Anfang und Ende eines Satzes oder Abschnittes zu markieren, um dadurch fur den Horer durch 
den Tonfall der synthetischen Stimme die Verstandlichkeit zu erhohen. Die erwahnte Expansion von Abkiirzungen 
kann ebenfalls mit dem SAYAS-Element von JSML vorgenommen werden, wobei vorzugsweise anwendungsspezifi- 
sche Abkurzung vorgangig durch gewohnliche Textsubstitution expandiert werden. 

[0032] Die konkrete Implementation stutzt sich beispielsweise auf ein Lieferpacket, das in einer Klasse "javax. 
speech" eine Methode "createSynthesizer" zur Verfugung stellt. Mit der Methode "Allocate" werden die benotigten 

Resourcen, wie z.B. 

[0033] Prioritat und Speicherplatz bereitgestellt und mit der Methode "Resume" in eine aktiven Zustand uberfuhrt. 
Die Methode "Generate" synthetisiert aus einem wie vorstehend enwahnt prosodisch erganzten Zeichenstring eine 
Sprachmeldung, z.B. im Dateiformat .mp3 oder.wav. Mit der Methode "Deallocate" werden die bereitgestellten Re- 
sourcen wieder freigegeben. Dieser sequentiell dargestellte Ablauf ist dabei zeitlich mehrfach parallel, um verschie- 
dene Anrufer gleichzeitig bedienen konnen. Eine geforderte hohe Parallelitat wird vorzugsweise mit einer Implemen- 
tation erreicht, die der in Fig. 2 angegebenen Struktur eines Rechnersystems entspricht. 

[0034] Eine Verwendung von Java hat den Vorteil, das sowohl fur die Dialogmaschine 5 wie auch fur das Interfacing 
zur Sprachsyntheseeinheit 2 die Programmiersprachen insoweit homogen ist, als dies die Entwicklung vereinfacht. 
[0035] Durch die Aufteilung der Funktionseinheiten auf die verschiedenen Server 10, 20, 30 und 40 ist es auch 
moglich gleichzeitig verschiedene Produkte einzusetzen, z.B. verschiedene Sprachsynthese-Produkte furdie Sprach- 
syntheseeinheit 2 bzw 12, 22, .. Oder verschiedene Spracherkennungs-Produkte fur die Spracherkennungseinheit 3 
bzw. 13, 23, gemassder Darstellung in Fig. 2. Dadurch werden diese Einheiten 12, 22, .. bzw. 13, 23, .. untereinander 
austauschbar, so dass ein Produkte-Wechsel bei Einhaltung der Schnittstellen in den verschieden Sichten 61 , 62 bzw. 
63, 66 des erfindungsgemassen Kommunikationssystem ohne eine Neu-lntegration erfolgen kann. 
[0036] In einer weiteren Ausfuhrungsform der vorliegenden Erfindung kann vorgesehen sein, dass ein Anrufer mit 
einer eingehenden Meldung ein sogenanntes Alarmfenster definieren kann. Beispielsweise kann fur den Zustand eines 
Netzwerkelementes eine Schwelle definiert werden. Bei Ueberschreiten einer vom Anrufer festgelegten Schwelle, z. 
B. eine bestimmte Anzahl von Alarmen oder Alarme ab einer bestimmten Prioritat erfolgt vom erfindungsgemassen 
Kommunikationssystem eine Ubermittlung einer Antwortmeldung an den vorerwahnten Anrufer; z.B. "Das Netzelement 
Wulflingen 3 weist 4 Alarme der Stufe 2 und hoher auf". Das Medium dieser Antwortmeldung kann als eine Textmeldung 
mit dem Dienst SMS (Short Message Service) auf ein GSM-Terminal ausgebildet sein oder als Anruf, dessen synthe- 
tische Stimme in der Sprachsyntheseeinheit 2 erzeugt wurde. Der vorstehend enwahnte Schwellwert ist auch auf nicht 
technische Anwendungen anwendbar, z.B. ein bestimmter Kurswert einer Aktie. 
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Text-Vorverarbeitungseinheit 


2 


Sprachsyntheseeinheit 


3 


Spracherkennungseinheit 
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Vermittlungseinheit 
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Dialogmaschine 
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Akustische Vorverarbeitungseinheit 
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Textausgabe-Dispatcher 
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Sprachausgabe-Dispatcher 
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Date n bank 
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Erster Server 


12 


Sprachsyntheseeinheit auf erstem Server 


13 


Spracherkennungseinheit auf erstem Server 


14 


Vermittlung/Dialogmaschine auf erstem Server 


20 


Zweiter Server 


22 


Sprachsyntheseeinheit auf zweitem Server 


23 


Spracherkennungseinheit auf zweitem Server 
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24 Vermittlung/Dialogmaschine auf zweitem Server 

30 Dritter Server 

32 Sprachsyntheseeinheit auf drittem Server 

33 Spracherkennungseinheit auf drittem Server 

34 Vermittlung/Dialogmaschine auf drittem Server 
40 Vierter Server 

48 Lol^ales Netzwerk 

49 Datenbank auf viertem Server 

50 Lastverteilung 

52 Sprachausgabemodul 

53 Spracheingabemodul 

60 Externe Schnittstelle 

61 Steuerungsschnittstelle zum Sprachausgabemodul 52 

62 Informationsfluss im Sprachausgabemodul 52 

63 Informationsfluss im Spracheingabemodul 53 

66 Steuerungsschnittstelle zum Spracheingabemodul 53 

68 Schnittstelle zu den Terminals 

69 Schnittstelle zur Datenbank 



Patentanspriiche 

1. Verfahren zur Generierung von Antwortmeldung auf eingehende IVleldungen mittels eines mit wenigstens einer 
Datenbank (9) koppelbaren Kommunikationssystems, das enthalt: 

eine Vermittlungseinheit (4) 

wenigstens ein Spracheingabemodul (53, 3), 

wenigstens ein Sprachausgabemodul (52, 2) und 

wobei die Meldungen als 

Anrufe in Echtzeit oder als 

gespeicherte Anrufe ausgebildet sind 

und wobei Terminals fur Agenten dem Kommunikationssystem zugeordnet sind, 
gekennzeichnet durch folgende Verfahrensschritte: 

A1 von den bei der Vermittlungseinheit (4) eingehenden Meldungen werden Art und Ursprung analysiert, mit 
der jeweiligen Meldung verknupft und in einem ersten Speicherbereich als typisierte Adresse (TYPE_ADDR) 
abgelegt, 

B1 dem Spracheingabemodul (53, 3) zugefuhrte und vom Spracheingabemodul (53, 3) verarbeitete Anrufe 
werden in Anfragen (QUERYFILE) konvertiert, die zur wenigstens einen Datenbank (9) ubermittelt werden 
und von der Datenbank (9) generierte Antwortmeldungen werden in einem zweiten Speicherbereich abgelegt; 
C1 vom Spracheingabemodul (53, 3) nichtverarbeiteteodernichtverarbeitbare Anrufe werden einem Agenten 
zugewiesen; 

D1 die im zweiten Speicherbereich abgelegten Antwortmeldungen werden abhangig von Angaben der im 
ersten Speicherbereich abgelegten typisierten Adresse (TYPE_ADDR) direktoder als eine im Sprachausga- 
bemodul (52, 2) konvertierte Antwortmeldung an den Ursprung der eingegangenen Meldung ubermittelt. 

2. Verfahren nach Anspruch 1 , 
dadurch gekennzeichnet, dass 

die im Verfahrensschritt D1 vom Sprachausgabemodul (52, 2) konvertierten Antwortmeldungen mitfesten Sprach- 
texten erganzt werden. 

3. Verfahren nach Anspruch 1 oder 2, 
dadurch gekennzeichnet, dass 

im Verfahrensschritt C1 jene Antwortmeldungen, die aufgrund von Agenten erzeugten Anfragen zur wenigstens 
einen Datenbank (9) generiert werden, ebenfalls im zweiten Speicherbereich des Rechnersystems (10, 20, ..) 
abgelegt werden. 
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4. Verfahren nach einem der Anspruche 1 bis 3, 
dadurch gekennzeichnet, dass 

in einem zusatzliclien Verfahrensscliritt B11 in Textform eingeliende IVIeldungen nacli Feststellung einer korrekten 
Syntax zu Anfragen zur wenigstens einen Datenbank (9) konvertiert werden. 

5 

5. Verfahren nacli Ansprucli 4, 
dadurch gekennzeichnet, dass 

die im zusatzliclien Verfalirensschritt B11 nicht konvertierbaren in Textform eingegangenen Meldungen entweder 
im Verfalirensschritt C1 einem Agenten zugewiesen Oder mit der im Verfahrensschritt A1 abgelegten typisierte 
10 Adresse (ADDR) gespeichert werden. 

6. Verfahren nach Anspruch 5, 
dadurch gekennzeichnet, dass 

die zusammen mit der typisierten Adresse (ADDR_TYPE) gespeicherte Textmeldung vor Ausfuhrung des Verfah- 
15 rensschrittes D1 mit einem Hinweistext erganzt wird, der vom Ergebnis der im Verfahrensschritt B11 vorgenom- 

menen Konversion abhangig ist. 

7. Verfahren nach einem der Anspruche 1 bis 6, 
dadurch gekennzeichnet, dass 

20 im Verfahrensschritt D1 vorgangig der Konversion im Sprachausgabemodul (52, 2) die Antwortmeldung in einer 

im Sprachausgabemodul (52, 2) enthaltenen Text-Vorverarbeitungseinheit (1 ) bezuglich der in der Antwortmeldung 
enthaltenen Ziffern gruppiert wird oder bezuglich in der Antwortmeldung enthaltenen fremdsprachigen Wortern 
phonetisch oder prosodisch erganzt wird. 

25 8. Verfahren nach einem der Anspruche 1 bis 7, 
dadurch gekennzeichnet, dass 

im Verfahrensschritt 81 die vom Spracheingabemodul (53, 3) verarbeiteten vorgangig der Ubermittlung an die 
Datenbank in einem im Spracheingabemodul (53, 3) enthaltenen Textausgabe-Dispatcher semantisch und/oder 
syntaktisch uberpruft wird. 

30 

9. Verfahren nach einem der Anspruche 1 bis 8, 
dadurch gekennzeichnet, dass 

im Verfahrensschritt 81 die eingehenden Meldungen in einem im Spracheingabemodul (53, 3) enthaltenen aku- 
stischen Vorverarbeitungseinheit (6) einer Rauschunterdruckung unterzogen oder bezuglich einer Pegelabwei- 
35 Chung korrigiert werden. 

10. Kommunikationssystems zur Generierung von Antwortmeldungen auf eingehende IVIeldungen das enthalt: 

wenigstens ein Spracheingabemodul (63, 3), 
40 - wenigstens ein Sprachausgabemodul (52, 2), 

eine Vermittlungseinheit (4) und 

wobei die Meldungen als 

Anrufe in Echtzeit oder als 

gespeicherte Anrufe ausgebildet sind, 
45 und dem Kommunikationssystem wenigstens eine Datenbank (9) und Terminals fur Agenten zugeordnet sind, 

dadurch gekennzeichnet, dass 

uber die Vermittlungseinheit (4) eingehende Meldungen in einem ersten Speicherbereich speicherbar sind 

und zum Spracheingabemodul (63, 3) schaltbar sind, 

vom Spracheingabemodul (53, 3) generierte Anfragen zur zugeordneten Datenbank ubermittelbar sind und 
50 von der Datenbank (9) generierte Antwortmeldungen in Textform in einem zweiten Speicherbereich speicher- 

bar sind, 

vom Spracheingabemodul (53, 3) nicht verarbeitete oder nicht verarbeitbare Meldung einem Agenten zuweis- 

bar sind; 

im zweiten Speicherbereich gespeicherte Antwortmeldung direkt oder uber eine im Sprachausgabemodul (52, 
55 2) konvertierte Antwortmeldung dem Ursprung der eingehenden Meldung ubermittelbar ist. 

11. Kommunikationssystem nach Anspruch 10, 
dadurch gekennzeichnet, dass 



10 



EP 1 241 600 A1 



das Sprachausgabemodul (52, 2) eine Textvorverarbeitungseinheit (1), eine Sprachsyntheseeinheit (2) und einen 
Sprachausgabe-Dispatcher (8) enthalt. 

12. Kommunikationssystem nach Anspruch 10 oder 11 , 
5 dadurch gekennzeichnet, dass 

das Spracheingabemodul (53, 3) eine akustische Vorverarbeitungseinheit (6), eine Spracinerkennungseinheit (3) 
und einen Textausgabe-Dispatclier (7) enthalt. 

13. Kommunikationssystem nacli einem der Anspruclie 10 bis 12, 
10 dadurch gekennzeichnet, dass 

an die Vermittlungseinheit (4) eine Dialogmaschine (5) angeschlossen ist, die die Dialoge selbstandig steuert. 

14. Kommunikationssystem nach Anspruch 11 oder 12, 
dadurch gekennzeichnet, dass 

15 die Vermittlungseinheit (4) und/oder das Spracheingabemodul (53, 3) und/oder das Sprachausgabemodul (52, 2) 

auf mehrere uber ein Netzwerk verbundene Server (10, 20, ..) verteilt implementiert ist. 

15. Kommunikationssystem nach Anspruch 14, 
dadurch gekennzeichnet, dass 

20 Schnittstellen (62, 63; 61 , 66) zur Sprachsyntheseeinheit (2) oder zur Spracherkennungseinheit (3) so ausgebildet 

sind, dass auf den verschiedenen Servern (10, 20, ..) verschiedene Sprachsyntheseeinheiten (2) oder verschie- 
dene Spracherkennungseinheiten (3) auf den Servern (10, 20, ..) gegenseitig austauschbar sind. 

16. Kommunikationssystem nach Anspruch 15 oder 14, 
25 dadurch gekennzeichnet, dass 

ein Server (40) vorgesehen ist, auf dem eine Lastverteilung (50) implementiert ist, die die eingehenden Anrufe 
und/oder die generierten Anfragen und/oder Antwortmeldungen zur Verarbeitung auf verschiedene Server (10, 
20, ..) zuweist. 

30 17. Kommunikationssystem nach Anspruch 11 oder 12, 
dadurch gekennzeichnet, dass 

die Vermittlungseinheit (4), das Spracheingabemodul (53, 3) und das Sprachausgabemodul (52, 2) auf je einem 
uber ein Netzwerk verbundenem Server (10, 20, ..) implementiert ist. 
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KATEGORIE DER GENAINJNTEN DOKUMErvJTE 

X : von besoiiderer Bedeulung allein betrachtel 

Y : von besonderer Bedeutung in Vetbindurtg mil einer 

and(:3rf3n VerSffentlfechung derselben Kategorie 
A : technologischer Hintergrund 
O : nichtschriltliche Olfenbarung 
P : Zwisch&nliteratur 



T : der Erfindung zugrunde liegende Theorien Oder Grundsatze 
E ; aiteres Patentdokument, das jedoch erst am Oder 
oach dem Anmeldedatum verSffentlicht worden ist 
D ; in der Ar^meldung angefOhrtee Dokument 
L : aus anderen Grunden angefOhrtes Dokument 

& : Mitgltoddergieichen Paten1familie,Qberefnstimmendes 
Dokument 
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In diesem Anhang sind die Mitglieder cier Patentfamilien der im obengenannten europSlischen Recherchenberichi angefuhrten 
Patentdokumente angegeben. 

Die Angaben Ober die FamilienmltgiiGdsr entspreciien dem Stand der Datei des Europaisciien Patentamts am 
Diese Angaben dienen nur zur Unterrichtung und erfolgen ohne Gewaiir. 
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